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Konzepte und Verfahren 
für die moderne Datensicherung 


Vorbei sind die Zeiten, in denen der Administrator den 
Datenbestand allnächtlich auf Band sicherte. Heutige 
Geschäftsanforderungen lassen sich oft nur mit 
modernen Techniken wie Snapshots, Deduplizierung 
und CDP erfüllen. Der Tatsache müssen auch die 
Anbieter von Backup-Software Rechnung tragen. 


D as klassische Backup 
verändert sein Gesicht. 
Immer mehr Unternehmen 
gehen dazu über, Daten auf 
Festplatte zu sichern - nicht 
nur als Zwischenschritt, son- 
dern für längerfristiges Backup 
und sogar für die Archivierung. 
Dies begünstigt die Anwendung 
neuer Verfahren zur Daten- 
sicherung wie Snapshots, De- 
duplizierung und Continuous 
Data Protection (CDP). 

Historisch betrachtet be- 
deutete Backup, dass der Ad- 
ministrator einmal pro Woche 
— meist am Wochenende - 
eine Vollsicherung auf Tape 
durchführte und sie an jedem 
Wochentag, in der Regel nach 
Feierabend, durch ein inkre- 
mentelles oder differenzielles 
Backup der neuen und verän- 
derten Dateien ergänzte, eben- 
falls auf Tape. Viele Unterneh- 
men praktizieren es noch 
heute so. 

Komplexere Speicherinfra- 
strukturen (Tiered Storage) ver- 
ändern jedoch diese Praxis. 
Das Band als Datenspeicher 
verschiebt sich in der Speicher- 
hierarchie immer weiter nach 


hinten: Wo ehemals nur bei 
DAS (Direct Attached Storage) 
oder SAN (Storage Area Net- 
work) zunächst auf Platte und 
anschließend auf Tape gesi- 
chert wurde, hat sich heute 
eine Hierarchie von Online-, 
Nearline- und Offlinespeicher 
etabliert, teilweise mit mehre- 
ren Unterstufen (siehe Abbil- 
dung 1). Jedes Unternehmen 
hat eine individuelle Ausfor- 
mung dieser Hierarchie im Ein- 
satz, ob es ihm bewusst ist 
oder nicht. Rechnet man Solid 
State Disks (SSD) als Zusatz- 
Cache für besonders schnellen 
Datenzugriff (Tier 0) mit, kom- 
men viele Anwender auf eine 
Hierarchie mit fünf oder mehr 
Stufen. 


Disk ist 
schneller als Tape 


Für diese Entwicklung gibt es 
diverse Gründe. Dazu zählen 
geschäftliche Anforderungen, 
etwa bestimmte Anwendungs- 
daten lange im Onlinezugriff zu 
halten, wobei man aufgrund 
der technischen Entwicklung 
einen kleineren Anteil auf hoch- 


Storage 


performanten und teuren Fibre- 
Channel- oder SAS-Platten be- 
lässt und einen größeren auf 
weniger leistungsfähige, aber 
billigere SATA-Platten ver- 
schiebt. Von dort sichert man 
die Daten häufig auf eine Virtu- 
al Tape Library (VTL), weil das 
Kopieren von Disk zu Disk 
komfortabler und schneller ist 
als von der Platte direkt aufs 
Band. Die gefürchteten (zu) 
kleinen Backup-Fenster lassen 
sich so besser nutzen. Eine 
wachsende Zahl von Unterneh- 
men verzichtet mittlerweile 
darauf, die Backups anschlie- 
Bend auf eine echte Tape Li- 
brary auszulagern. Selbst eine 
Archivierung auf Bändern fin- 
det nicht mehr in jedem Fall 
statt. 

Nach Ansicht der Gartner- 
Analysten Dave Russell und 
Carolyn DiCenzo liefert Tiered 
Storage nicht nur eine Vielzahl 
von Performance- und Kosten- 
stufen für die zu speichernden 
Daten, sondern stellt zuneh- 
mend auch unterschiedliche 
Ansätze für Backup und Reco- 
very zur Verfügung [1]. Neue 
Verfahren zur Datenreduzie- 
rung und Replikation, geringe- 
re Übertragungskosten durch 
alternative Verbindungstechni- 
ken wie iSCSI oder Fibre Chan- 
nel over Ethernet (FCoE) sowie 
der Aufbau größerer und kos- 
tengünstigerer Speicherumge- 
bungen (Grids) dürften das 
Outsourcing von Backup und 
Recovery attraktiver machen, 
wie Amazons Simple Storage 
Service (S3) oder EMCs Mozy 
schon heute zeigen. 

IT ist nur in seltenen Fällen 
ein Profit Center, das direkt zu 
Umsatz und Gewinn eines 


Storage-Pyramide: 
Eine Speicher- 
hierarchie kann 
etliche Stufen 
enthalten, die sich 
in puncto Kosten, 
Performance, 
Kapazität und 
Aufbewahrungszeit 
unterscheiden 
(Abb. 1). 


Unternehmens beiträgt. Im 
normalen Alltag unterstützt sie 
die Geschäftsabläufe und er- 
höht durch das Wegrationali- 
sieren menschlicher Arbeits- 
kraft oder die Beschleunigung 
von Arbeitsprozessen die Pro- 
duktivität. Insgesamt verur- 
sacht die unternehmensinterne 
IT jedoch Kosten, die sich ge- 
rade bei Prozessen wie der 
Datensicherung nicht schön- 
reden lassen. 


Wenig Mittel fürs 
ungeliebte Kind 


Praktische Folge sind Wider- 
stände bei der Bereitstellung 
finanzieller Mittel für Szena- 
rien, von denen man nicht 
weiß, ob sie jemals eintreten. 
Der Backup-Beauftragte im 
Unternehmen muss häufig all 
seine Überredungskünste nut- 
zen, um überhaupt eine Mini- 
malinstallation für Backup und 
Recovery bereitstellen zu kön- 
nen. Manche freut es sogar, 
wenn Daten verloren gehen: 


RPO RTO 


aA A A Ak 4 
Wochen Tage Stunden Minuten Sek 


aA A A kA 4 
Sek Minuten Stunden Tage Wochen 


The gap is 
narrowing 


RPO = Recovery Point Objective, 
RPO = Data Loss 


RTO = Recovery Time Objective, 
RTO = Downtime 


Zeitpunkte: Anforderungen an ein Backup/Recovery-Verfahren 
lassen sich mit den Parametern RPO und RTO charakterisieren 


(Abb. 2). 


Quelle: FSC 


Nur so können sie durch eine 
gelungene Wiederherstellung 
den Nachweis erbringen, dass 
das in die Datensicherung in- 
vestierte Geld sinnvoll ange- 
legt ist. 

Für geschäftskritische An- 
wendungen wie SAP oder 
Oracle, die eine unmittelbare 
Wiederherstellung des ur- 
sprünglichen Zustands verlan- 
gen, ist die traditionelle tägli- 
che Datensicherung nicht 
mehr ausreichend. Wie Dave 
Russell im Gespräch darlegt, 
zeigen Kundenbefragungen, 
dass immer mehr Anwender 
den Nutzen der herkömmlichen 
Bandsicherung anzweifeln. Als 
Grund für diese Entwicklung 
sieht er die ständigen Ände- 
rungen, denen geschäftskriti- 
sche Daten unterworfen sind. 


Tägliche Sicherung 
hat ausgedient 
Es gibt nicht mehr nur einen 


Sicherungs- oder Recovery- 
Punkt, sondern viele, die sich 


über den ganzen Tag verteilen. 


Unter diesen Bedingungen nur 
einmal täglich zu sichern, be- 
deutet bei einem Ausfall den 
Verlust der Arbeit von bis zu 
24 Stunden. Immer mehr 
Unternehmen setzen als vor- 
beugende Maßnahme host- 
basierte Snapshots in Interval- 
len von einigen Minuten oder 
Stunden ein oder sichern alle 


Tier 1 


> Tier 2 


Quelle: Horison Information Strategies 


zwei bis drei Stunden den 
Datenbestand auf sekundären 
Plattenspeicher. 

Tape und nächtliche Back- 
ups können für bestimmte Ap- 
plikationen ausreichend sein, 
aber für Daten, die länger auf 
Tier 1 liegen, sollte man mehr 
tun, meint Russell. Es gibt 
heute ausgefeilte Recovery 
Tiers und Verfahren bezie- 
hungsweise Software, die 
Datenverluste begrenzen. 
Außerdem lassen sich Syste- 
me schneller wiederherstellen 
als beim umständlichen 
Wiedereinspielen von Siche- 
rungsbändern. 

Aus den Geschäftsanforde- 
rungen lässt sich die soge- 
nannte Recovery Point Objec- 
tive (RPO) ableiten. Sie gibt die 
maximale Zeit zwischen einem 
Ausfall und der letzten Daten- 
sicherung an. Gleichzeitig ist 
sie ein Maß für die Höhe der 
zu erwartenden beziehungs- 
weise tolerierbaren Datenver- 
luste - je länger die letzte Si- 
cherung zurückliegt, desto 
mehr Daten gehen verloren. 
Unter Recovery Time Objective 
(RTO) hingegen versteht man 
die Zeit, die man zur vollstän- 
digen Wiederherstellung nach 
einem Ausfall benötigt (siehe 
Abbildung 2). 

RAID-Pannen und Katastro- 
phen wie Feuer, Überschwem- 
mungen oder terroristische 
Angriffe kommen vergleichs- 
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Backup to Disk 


Local Replication, Snapshot, or Mirroring 


Virtual Tape Libraries [VTL) 


Remote Replication, Snapshot, or Mirroring 


Continuous Data Protection (CDP) 


0% 


47%] 


10% 20% 30% 


Aufholbedarf: Nach einer IDC-Umfrage nutzen nur wenige 
europäische Unternehmen die Möglichkeiten, die ein 
festplattenbasiertes Backup bietet (Abb. 3). 


weise selten vor. Das Gros 
aller Recovery-Fälle entsteht 
durch Anwender- oder Soft- 
warefehler - laut Gartner etwa 
80 Prozent. Ihnen kann man 
mit regelmäßigen Snapshots 
beikommen, die den aktuellen 
Zustand des Dateisystems 
„einfrieren“ und eine schnelle 
Wiederherstellung auch einzel- 
ner Dateien erlauben. Wählt 
man ausreichend kurze Snap- 
shot-Intervalle, lässt sich eine 
RPO von einigen Minuten er- 
reichen. 


Das „Einfrieren“ der Daten auf 
dem Host hilft allerdings nicht 


weiter, wenn das gesamte 
System ausfällt und man nach 
der Reparatur wieder auf den 
Stand der letzten, weiter zu- 
rückliegenden Sicherung aus- 
weichen muss. Continuous 
Data Protection (CDP) geht 
einen Schritt weiter: Sie er- 
fasst alle Änderungen und ko- 
piert sie auf ein zweites Spei- 
chermedium. Im Gegensatz zur 
Replikation, die nur den ak- 
tuellen Stand der Daten vor- 
hält, katalogisiert sie jedoch 
alle Änderungen, sodass man 
auch auf ältere Dateiversionen 
zugreifen kann. Da jeder 
Schreibvorgang umgehend ins 
Backup übernommen wird, ist 
die Recovery Point Objective 
praktisch Null. 


Quelle: IDC 


Snapshots wurden zuerst in 
der Mainframe-Welt von IBM 
und Storagetek (heute Sun 
Storagetek) entwickelt, wäh- 
rend bei den „Open Systems“ 
EMC, Netapp oder jüngst 
Compellent vergleichbare Ver- 
fahren entwickelten. Die Be- 
mühungen der Softwareprodu- 
zenten gehen laut Russell 
dahin, zusätzliche Funktionen 
in die Programme hineinzuver- 
lagern, aber erst in etwa fünf 
Jahren sei so etwas wie ein 
Unified Recovery Management 
zu erwarten. 


Backup-Anbieter wie Comm- 
vault, EMC oder Symantec ar- 
beiten daran, das Management 
von Arrays mit Disk-to-Disk- 
Techniken, Snapshots oder der 
Integration von NAS-Filern zu 
verbinden. Start-ups wie Topio 
oder Timespring, die CDP- 
Produkte entwickelt hatten, 
wurden von Netapp bezie- 
hungsweise Doubletake über- 
nommen. Während der Einsatz 
von Snapshots bereits recht 


verbreitet ist, gilt dies nicht für 
Continuous Data Protection. 
Viele Anwender geben freimü- 
tig zu, den Begriff noch nie ge- 
hört zu haben. 


Backup ist die Disziplin mit der 
höchsten Redundanz und der 
größten Wiederholrate, die 
man heute in Unternehmen 
findet: Alles, was sich an 
Daten auf den Online-Spei- 
chersystemen befindet, wird 
noch einmal in eine neue 
Instanz übernommen - ein- 
schließlich aller vorhandenen 
Kopien. Das nächste Full 
Backup sichert alle Daten ein 
weiteres Mal, obwohl sich in 
der Regel über 90 Prozent der 
Dateien im Laufe ihres Lebens 
gar nicht mehr ändern. Der 
selbstständige Analyst Josh 
Krischer schätzt, dass heute 
von jeder in einem Unterneh- 
men erzeugten Datei durch- 
schnittlich sieben Kopien exis- 
tieren, die das Backup immer 
wieder sichert. Deduplizierung 
kann die unnötige Redundanz 
der gesicherten Daten verrin- 
gern — vorausgesetzt, man Si- 
chert auf Festplattensysteme. 
Bislang machen allerdings nur 
wenige Anwender Gebrauch 
davon. 

Deduplizierung, seit Ende 
2006 von einigen Herstellern 
propagiert und durch diverse 
Firmenübernahmen unterfüt- 
tert - Avamar ging an EMC, 
Rocksoft an ADIC beziehungs- 
weise Quantum, Diligent an 
IBM -, ist eine Weiterentwick- 
lung von Single Instance 
Storage (SIS). Das Verfahren 
verringert den Speicherplatz- 
bedarf, indem es Dateien le- 
diglich einmal speichert und 
alle Kopien durch Verweise er- 
setzt. SIS kommt unter ande- 
rem bei Mailsystemen wie Ex- 
change, Archivprodukten wie 
EMCs Centera oder bei Lösun- 
gen für den Datenschutz wie 
Connected Backup von Iron 
Mountain zum Einsatz. 
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Statt mit ganzen Dateien arbeitet De- 
duplizierung mit Bruchstücken davon, 
sogenannten „Chunks“. Die Verfahren 
der einzelnen Anbieter arbeiten mit 
Chunks unterschiedlicher - manchmal 
variabler — Größe. Außerdem verwenden 
sie unterschiedliche Algorithmen für das 
Zerlegen der Daten, das Suchen nach 
identischen Chunks und das Reduzieren 
der Datenmenge [2]. Viele Hersteller 
geben eine erreichbare Platzersparnis 
zwischen 20:1 und 400:1 an. Sie hängt 
allerdings stark von der eingesetzten 
Backup-Methode ab. Zum Beispiel wird 
die Einsparung umso höher ausfallen, je 
öfter man eine Komplettsicherung 
durchführt. 

Außerdem kann ein Disk-Backup mit 
Deduplizierung die für die Wiederher- 
stellung benötigte Zeit verkürzen. Je 
länger die gesicherten Daten auf der 
Festplatte bleiben können, desto gerin- 
ger ist die Wahrscheinlichkeit, dass man 
für ein Restore auf die erheblich lang- 
sameren Sicherungsbänder zurückgrei- 
fen muss. 


Modernes Backup 
erfordert Festplatten 


Durch den Einsatz von Backup to Disk 
und Deduplizierung kann eine IT-Abtei- 
lung die Beeinträchtigung des täglichen 
Betriebs durch die Datensicherung re- 
duzieren. Doch viele Unternehmen sind 
noch nicht den entscheidenden Schritt 
gegangen, Festplatten für Nearline- und 
Backup-Umgebungen einzusetzen. 
Selbst die, die bereits Disks verwenden, 
stellen oft nur wenig Plattenkapazität 
für ihre Datensicherung bereit oder nut- 
zen Festplatten ausschließlich als 
Zwischenstation (Staging Disk), von der 
sie die Daten im Anschluss an das ei- 
gentliche Backup auf Band überspielen. 
Das zeigt eine von IDC im Jahr 2007 
unter 600 europäischen Unternehmen 
durchgeführte Umfrage (siehe 
Abbildung 3). 

Es bleibt abzuwarten, wie viele An- 
bieter dem Druck der Anwender, neue 
Funktionen in ihre Software zu integrie- 
ren, standhalten werden. Einige könnten 
noch mehr zu Nischenspielern werden — 
zumindest aus der Sicht von Gartner. 
Das Unternehmen hat in einer aktuellen 
Untersuchung [3] neun Anbieter — Atem- 
po, Bakbone Software, CA, Commwvault, 
EMC, HP, IBM, Symantec und Syncsort 
— unter die Lupe genommen und bewer- 


tet. Im Gegensatz zu früheren Betrach- 
tungen haben die Analysten neue 
Kriterien angewendet, darunter die 
Unterstützung von plattenbasierter 
Wiederherstellung, Virtual Tape und De- 
duplizierung, Support für Umgebungen 
mit Server-Virtualisierung sowie die Ein- 
bindung von Zweigstellen ins zentrale 
Backup-System. 


Komplettlösungen 
sind gefordert 


Einige Hersteller neigen laut Gartner 
noch zu isolierten Angeboten. Der 
Umbau von Backup-Angeboten zu kom- 
pletten Recovery Management Tools, 
die sich weniger um Magnetbänder und 
einfache Disk-Lösungen als um anwen- 
dergerechte Software mit RPO- und 
RTO-Vorgaben kümmern, stehe erst am 
Beginn. Backup-Software für Unterneh- 
men, die sich diesen neuen Anforderun- 
gen nicht stelle, werde im Wettbewerb 
zurückbleiben und in einer Nische ver- 
harren. Außerdem haben inzwischen 
weitere Hersteller das Terrain betreten. 
Zu den Angeboten zählen netzgestützte 
Replikation (Brocade, F5 Networks, Ri- 
verbed), eigene Snapshot-Funktionen 
(Netapp) oder dedizierte Deduplizie- 
rungsprodukte wie die von Data Do- 
main. Hinzu kommen Anbieter von Soft- 
ware as a Service (SaaS) und Storage as 
a Service. 

Anwender müssen die eigenen Anfor- 
derungen klar formulieren, damit sie die 
vorhandenen Angebote bewerten können. 
Neben dem Funktionsumfang und Para- 
metern wie RPO/RTO sollten sie dabei 
auch „weiche“ Faktoren wie Wartung, 
Support und Lizenzgestaltung nicht außer 
Acht lassen. (mr) 

Hartmut Wiehr 

ist Fachjournalist in München und 
Herausgeber des Storage Compendium — 
Das Jahrbuch 2006/2007. 
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Ob als Speichererweiterung mit SAS Festplatten für Datenbankanwendungen und zentrales Storage für Servervirtualisierung 
oder zur schnellen Speichererweiterung mit günstigen SATA Festplatten für File- und Backup Server. 


% 2x FC4GB oder 4x 1GB iSCSI oder 2x SAS Interface % _Erweiterbar um bis zu 3 JBOD 16-bay Einheiten 
% _Snapshot-on-the-Box % bis 64 TByte Kapazität brutto 
% SNMP % SMTP 
% Web Management GUI % unterstützt SAS und SATA HDD (auch gemischt) 
% 2x 500 Watt red Netzteil %  Securion Interface (Einbindung in Alarmsysteme) 
ICEBOX-FQS 16 Bay ICEBOX-ISQS 8Bay 
- max. 16.0 TByte brutto - max. 8.0 TByte brutto 
- red. Netzteil 2x 500 Watt - red. Netzteil 2x 500 Watt 
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Nur keine 
Hierarchien 


Backup im Unternehmen - 
ein ungeschminktes Beispiel 


Unternehmen, die über genügend Expertise und 
Kaufkraft verfügen, halten Abstand zu den Marketing- 
übungen der Hersteller. Da sie wissen, was sie 
benötigen, sind sie in der Lage, Dienstleistungen 
statt Versprechen einzukaufen. Das zeigt ein Beispiel 


aus der Praxis. 


F eim Autozulieferer ZAG 
aus dem Ruhrgebiet, 
dessen wahrer Name auf eige- 
nen Wunsch ungenannt blei- 
ben soll, versteht sich das be- 
triebseigene Rechenzentrum 
als Dienstleister, der Fachab- 
teilungen und Standorte in 
Deutschland und im europäi- 
schen Ausland zu seinen 
„Kunden“ zählt. Innerhalb des 
zentralen Rechenzentrums ist 
eine Arbeitsgruppe für die 
Backup-Konzepte sowie für 
Kontakte und Verhandlungen 
mit den Herstellern zuständig, 
während die Umsetzung im 
Verantwortungsbereich der 
Applikationsbetreuer liegt. 
Innerhalb der IT-Infrastruktur 
finden sich bei dem Unterneh- 
men noch einige Mainframes. 
Doch ist ihre Bedeutung inzwi- 
schen geringer als die der 
„Open Systems“: der Unix- und 
Windows-Server. Die Storage- 
Infrastruktur ist weitgehend in 
einem SAN konsolidiert, wobei 
ZAG Produkte zweier Hersteller 
einsetzt: EMC und Hitachi Data 
Systems (HDS). Das zahlt sich 
bei Verhandlungen mit den bei- 
den Lieferanten aus, wenn es 
um bestimmte inhaltliche For- 
derungen bei den Produkten 
geht, aber auch bei Lizenzen 
und Preisen hält man einen 
Hebel in der Hand. Praktische 
Folge: Beide Hersteller sind 
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etwa zu gleichen Teilen im 
Unternehmen vertreten. Zu- 
sätzlich setzt ZAG Systeme von 
Netapp als Fileserver ein. Für 
die Datensicherung kommt flä- 
chendeckend der Tivoli Storage 
Manager (TSM) von IBM zum 
Einsatz. 


Klassenkampf 
der Dateien 


Die IT-Abteilung garantiert für 
bestimmte Services definierte 
Verfügbarkeiten und Anlaufzei- 
ten. Dies schlägt sich bei Back- 
up und Restore in drei unter- 
schiedlichen Storage- und 
Dateiklassen nieder, die genau 
festlegen, wie weit man etwa 
im Backup zurückgehen kann. 
Getrennt für Datenbanken und 
andere strukturierte Daten be- 
ziehungsweise unstrukturierte 
Dateien hat das Unternehmen 
drei Verfügbarkeitsstufen auf- 
gebaut: 

— 1. Hochverfügbarkeit auf Sys- 
temen mit hoher Performance, 
gespiegelt, mit langen Aufbe- 
wahrungszeiten beim Backup; 
— 2. fast gleich hohe Perfor- 
mance, jedoch ohne Spiege- 
lung, Backup mit reduzierten 
Aufbewahrungszeiten; 

— 3. geringere Performance, 
ungespiegelt, stärker reduzier- 
te Aufbewahrungszeiten für 
Backups. 


Für beide Datenklassen hat 
ZAG eine gemeinsame SAN- 
Umgebung eingerichtet. Dabei 
sind die Fileserver aufgrund 
ihrer „autistischen“ Natur teil- 
weise separat angesiedelt. „Sie 
kennen nur sich selbst, schau- 
en weder rechts noch links“, 
beschreibt der verantwortliche 
IT-Leiter die Schwierigkeiten, 
sie in eine gemeinsame Spei- 
cher- und Backup-Infrastruk- 
tur zu integrieren. Das sei 
durch die Konstruktion der 
NAS-Filer bedingt. Man wün- 
sche sich von Netapp, dass 
der Anbieter ein globales Da- 
teisystem einführt, das die In- 
tegration in die Backup-Umge- 
bung erleichtert. 

Netapp und Tivoli/IBM rea- 
gieren: Im nächsten Jahr wol- 
len die Unternehmen eine ge- 
meinsame Schnittstelle mit der 
Bezeichnung „Snapdiff“ her- 
ausbringen. Darauf, auf eine 
Standardisierung durch die 
Storage Networking Industry 
Association (SNIA) zu warten, 
habe ZAG zugunsten einer di- 
rekten Einflussnahme auf die 
Hersteller verzichtet. Dazu 
geht man bei dem Unterneh- 
men auch Allianzen mit ande- 
ren Anbietern oder Partnern 
aus der Automobilbranche ein 
- in der Gewissheit, dass eine 
gebündelte Kaufkraft allemal 
ein gutes Argument ist. 


HSM lohnt sich 
nicht immer 


Eine hierarchische Speicher- 
struktur mit mehreren Fest- 
plattensystemen „hinterein- 
ander“ hat die IT-Abteilung 
abgelehnt, weil die dem Kun- 
den garantierte Zuverlässigkeit 
auch für die nachgeordneten 
Systeme gewährleistet sein 
müsste. Sind die Daten auf 
günstigere Platten verschoben, 
müsste man sie nach diesem 
Ansatz noch einmal spiegeln. 
Das würde zusätzliche Kosten 
verursachen. 

Es kommt nach Ansicht der 
IT-Fachleute bei ZAG hinzu, 
dass fast alle hierarchischen 


Speichersysteme auf Win- 
dows-Dateisystemen beruhen. 
In dieser Umgebung könne 
man letztlich nur 15 bis 20 
Prozent der Daten wirklich mi- 
grieren. Obwohl man weiß, 
dass eigentlich 80 Prozent der 
Daten inaktiv sind, lassen sie 
sich nicht automatisch verla- 
gern: Die Informationen über 
den letzten Gebrauch (last use) 
einer Datei sind nicht zuverläs- 
sig. Die migrierten 15 bis 20 
Prozent noch einmal zu spie- 
geln, wäre ineffektiv und 
obendrein zu teuer. 


Redundanz ist 
kostspielig 


Es sei einfacher, die Daten auf 
einem Primärsystem zu halten 
und dem Kunden die Wahl 
zwischen unterschiedlichen 
Datentöpfen zu geben - mit 
hoher und geringerer Verfüg- 
barkeit sowie mit einer Verfüg- 
barkeit, die sogar Datenverlus- 
te in Kauf nimmt. Die Kosten 
für das Vorhalten eines Groß- 
teils der Daten auf einem 
teuren gespiegelten Primär- 
speicher nimmt man hin. Der 
zuständige Mitarbeiter kontert 
auf Nachfrage: „Es ist anders 
nicht billiger.“ Beim Primär- 
speicher müsse man nicht 
alles spiegeln, um eine hohe 
Verfügbarkeit zu gewährleis- 
ten. Man könne auch Daten- 
klassen definieren, die zwar 
dort liegen, aber nicht gespie- 
gelt werden. Letztlich sei das 
eine Frage des vom Kunden 
gewünschten Preis-Leistungs- 
Verhältnisses. 

Im Backup-Umfeld hat man 
noch wenig Tiered Storage in- 
stalliert. Normalerweise 
schiebt TSM die Daten auf 
einen Disk-Cache und migriert 
sie tagsüber unter Benutzung 
von Disk Libraries auf Band. 
Das sei bei dem gewählten 
Konzept die einzige Möglich- 
keit, ein Tiered Storage ein- 
zurichten, da man die Daten 
zunächst auf einem sehr per- 
formanten Speichersystem 
ohne Mount-Zeiten hat. 
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SUPERMICR® 


ENERGIEEFFIZIENTE 
SERVER 


Setzen Sie auf CPI Server-Systeme mit energieeffizienten Komponenten. Sichern Sie sich schon heute einen hohen 


ROI durch Stromeinsparung von bis zu 100 Watt/h pro System im Vergleich zu einem derzeit aktuellen Standard- 
Server-System. 


Dies erreichen wir für Sie durch den Einsatz von hochwertigen Komponenten: 


- 2.5" S-ATA oder SAS Festplatten 

- hocheffizienten Netzteilen mit einer Effizienz von bis zu 93% 
- größere LowVoltage Speichermodule (z.B. 4 GB statt 2 GB) 
- LowVoltage Prozessoren von Intel® oder AMD 


Damit läßt sich eine dauerhafte Einsparung für jeden Anwender im Entry- bis Enterprisesegment realisieren. 


CPI Computer Partner Handels GmbH 
Kapellenstr. 11 
D-85622 Feldkirchen/München 


Telefon +49 (0)89 - 96 24 41-0 
Telefax +49 (0)89 - 96 24 41-33 
Hotline 0800 - 100 82 69 

E-mail sales@cpigmbh.de 


Alle Marken- und Produktbezeichnungen sind Warenzeichen oder eingetragene Warenzeichen 
des entsprechenden Unternehmens. Druckfehler, Irrtümer und Änderungen vorbehalten. 
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Intern hat sich beim Backup 
im Unternehmen in den letzten 
Jahren nicht viel geändert, 
da man schon seit Jahren mit 
TSM auf dieselbe Software 
setzt. Es besteht ein grundsätz- 
licher Anspruch an die Leis- 
tungsfähigkeit und die Perfor- 
mance der Systeme, der mit 
dem regelmäßig erweiterten 
TSM erfüllbar sei. 


Überdies gelte, dass mit Sto- 
rage-Systemen, die schon vier 
Jahre alt sind, heute kaum 
mehr Staat zu machen sei, be- 
richtet der IT-Leiter. Dies liege 
vor allem am extremen Daten- 
wachstum, das zu bewältigen 
sei und das an die physischen 
Grenzen der Altsysteme gehe. 
Man bekommt die Daten beim 
Backup zum Teil nur noch 
schnell genug durch die Lei- 
tungen, wenn man massiv 
parallel arbeitet. Jede Nacht 
hat das ZAG-Rechenzentrum 
allein in Deutschland 70 bis 
80 TByte an inkrementellen 
Daten zu sichern. 

Backup ist ein „notwendi- 
ges Übel“, das man aber, so 
der IT-Leiter, professionell und 


ohne eine Laissez-faire-Hal- 
tung betreiben müsse, selbst 
wenn es einiges koste. Man 
müsse eben wie bei einer Le- 
bensversicherung relativ viel 
Geld bezahlen, obwohl man sie 
eigentlich gar nicht in An- 
spruch nehmen möchte. 


Kl 


Apropos Lebensversicherung: 
Ein teilweises Restore kommt 
häufig vor, weil irgendein Mit- 
arbeiter eine Datei verloren hat 
oder sie nicht mehr findet. Die 
SAP-Administratoren haben 
einen größeren Restore-Bedarf 
— nicht weil sie Daten verlie- 
ren, sondern weil sie ihre 
Test- oder Qualitätssysteme 
meistens aus einer Wiederher- 
stellung aufbauen. Der Vorteil 
für die Backup-Crew besteht 
darin, dass sie dies zugleich 
für eine Restore-Übung nutzen 
können. 

Komplette Systemwieder- 
herstellungen kommen maxi- 
mal fünf bis sechs mal pro 
Jahr vor. Der Anlass ist ge- 
wöhnlich, dass ein ganzes Da- 
teisystem verloren gegangen 
ist. Man müsse diese Handvoll 
Ausfälle allerdings zu einer 


IB-NAS4210/4220 
Netzwerk-Server (NAS) für 3,5" 
SATA HDDs, mit USB 2.0 und Gigabit 
Ethernet, niedriger Stromverbrauch, 
One Touch Backup Funktion, 
7-Server in einem 


www.tarox.de 
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sehr großen Umgebung von 
etwa 4000 Servern in Bezie- 
hung setzen. „Insgesamt pas- 
siert sehr wenig“, meint der 
zuständige Sachbearbeiter. 
Immerhin könne man in diesen 
wenigen Fällen beweisen, 
dass man durchaus die ver- 
lorenen Daten wiederherstel- 
len kann. 

Außerdem, versichert der 
Backup-Spezialist, veranstalte 
man natürlich jedes Jahr ein- 
mal gründliche Tests der 
Backup-Szenarien. Wie bei 
einer Feuerwehrübung wird 
überprüft, ob alles funktioniert 
— zum Beispiel das Wiederher- 
stellen eines Servers und sei- 
ner Applikationen aus dem 
Backup. Im Ernstfall, wenn 
man etwa nachts um drei Uhr 
aus dem Bett gerissen wird, 
weil ein Restore notwendig ist, 
ist einfach keine Zeit mehr für 
ein langes Studium der Hand- 
bücher. 

Für TSM als Backup-Lö- 
sung hat sich das Unterneh- 
men aus mehreren Gründen 
entschieden. Es handele sich 
um eine Software, die man mit 
relativ wenig Leuten in einer 
großen Umgebung managen 
kann. Außerdem ist sie hoch- 
gradig automatisiert und kann 


www.devil.de 


ein sogenanntes „Progressive 
Incremental Backup“ durch- 
führen (siehe Kasten). Diese 
Backup-Variante sichert jede 
Datei und jede Version nur ein- 
mal. Momentan hat man allein 
im Backup-Bereich etwa zwei 
Petabyte an physischem Spei- 
cherplatz belegt, was etwa 
vier Petabyte an logischen 
Daten entspricht. Verwendete 
man ein konventionelles Back- 
up-Konzept mit Tages-, Wo- 
chen-, Monats- und Vollsi- 
cherungen, hätte man ein 
Vielfaches dieser Datenmenge 
zu speichern. Allein die Kosten 
für die nötigen Magnetbänder 
wären erheblich. 


Die Frage nach einer weiteren 
Reduktion der Datenmengen 
durch Deduplizierung scheint 
sich in solch einem Kontext 
erst einmal nicht zu stellen. 
Die Backup-Experten bei ZAG 
haben hierzu eine eigene Posi- 
tion entwickelt: Man verfolgt 
eine doppelte Strategie, bei 
der man sich im Rechenzen- 
trum selbst erst einmal dazu 
entschlossen hat, sie nicht an- 
zuwenden, weil man Dedupli- 
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Progressive Incremental Backup 


Eine fortlaufende Datensicherung lässt sich auf mehrere Arten durchführen. Die ein- 
fachste besteht darin, regelmäßig alle Daten zu sichern (Full Backup). Allerdings hat 
das Verfahren zwei gravierende Nachteile: Vollsicherungen benötigen viel Speicher- 
platz und dauern lange. Ersterem kann man durch den Einsatz von Deduplizierungs- 
techniken begegnen. Der Zeitbedarf lässt sich damit jedoch nicht reduzieren. Im 
Gegenteil, er kann — abhängig vom verwendeten Verfahren — sogar noch steigen. 

Als Ausweg bieten sich differenzielle oder inkrementelle Backups an. Beide si- 
chern nur neue Dateien und solche, die sich seit der letzten Sicherung (inkremen- 
tell) oder dem letzten Full Backup (differenziell) geändert haben. Da die Mehrheit 
der Daten - oft über 90 % - sich nach dem Erstellen nicht mehr ändert, dauert ein 
inkrementelles Backup nur einen Bruchteil der Zeit, die man für eine Vollsicherung 
benötigt. Allerdings dauert ein Restore umso länger, je mehr inkrementelle Siche- 
rungen der Administrator einspielen muss. 

Differenzielle Sicherungen vermeiden diesen Nachteil. Dafür erkauft man sich 
einen anderen: Der Umfang des Backups wächst, wenn man sich vom Stand der 
letzten Vollsicherung entfernt. Ebenso die Zeitspanne, die man für die Sicherung 
benötigt. Gelegentlich muss der Admin daher ein Full Backup einschieben. Üblich 
sind Vollsicherungen am Wochenende und inkrementelle oder differenzielle Back- 
ups nach Feierabend. 


Wiederherstellung unvollständig 


Beim Restore von partiellen Sicherungen kann es zu Schwierigkeiten kommen. Tritt 
während der Wiederherstellung ein Fehler auf, lassen sich die folgenden Sicherun- 
gen in der Regel nicht mehr sauber einspielen. Als Folge können Dateien unter fal- 
schem Namen oder im falschen Verzeichnis auftauchen, oder bereits gelöschte 
wieder auf der Festplatte landen. Von der üblicherweise geforderten vollständigen 
und korrekten Wiederherstellung aller Daten kann daher keine Rede sein. 

Auch das Zurückholen einzelner, versehentlich gelöschter oder durch Software- 
fehler beschädigter Dateien - ein Fall, der in der Praxis weit häufiger auftritt als 
eine komplette Wiederherstellung nach einem Hardware-Ausfall — erfordert bei in- 
krementellen und differenziellen Sicherungen mehr Aufwand. Unter Umständen 
muss der Administrator dafür alle Sicherungsbänder einlesen. 

Progressive Incremental Backup, manchmal auch Progressive Backup genannt, 
bietet wie eine Vollsicherung eine schnelle und korrekte Wiederherstellung — auch 
einzelner Dateien — und gleichzeitig kurze Backup-Zeiten, wie man sie vom Incre- 
mental Backup kennt. Ersteres erreicht es durch „Umdrehen“ des Backup-Reposi- 
tory: Die jeweils letzte Sicherung liegt als Full Backup vor, alle älteren als soge- 
nannte Reverse Incrementals. 

Außerdem sind alle gesicherten Dateien und Versionen in einer Datenbank ge- 
speichert. Anhand dieses Verzeichnisses kann die Backup-Software feststellen, 
welche Dateien bereits gesichert sind; sie muss also wie beim Incremental Backup 
nur die ungesicherten zum Sicherungsserver übertragen. Der übernimmt die Da- 
teien ins Full Backup und verschiebt eventuell vorhandene ältere Versionen in ein 
neues Reverse Incremental. Ein Flag in der Datenbank zeigt an, ob eine Datei zur 
letzten Sicherung gehört (aktiv) oder nicht (inaktiv). 

Ein weiterer Vorteil des Verfahrens ist, dass man für jedes System nur eine ein- 
zige Vollsicherung durchführen muss: zu Beginn, wenn man es in seine Backup- 
Infrastruktur einbindet. Alle folgenden Sicherungen sind inkrementell (Incremental 
Forever), solange der Administrator nicht ausdrücklich eine neue Vollsicherung ver- 
langt. Das dürfte allerdings nur selten notwendig sein. 

Darüber hinaus erlaubt Progressive Incremental Backup es, nicht mehr benötig- 
te Sicherungen automatisch aus dem Bestand zu entfernen: Der Backup-Server 
muss lediglich alte Reverse Incrementals löschen und seine Datenbank aktualisie- 
ren. Der Administrator hat nichts weiter zu tun als die gewünschte Haltezeit (Reten- 
tion Time) einzustellen. Michael Riepe 
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zierung wegen der Perfor- 
mance-Beeinträchtigung und 
der Kosten nicht flächende- 
ckend einsetzen kann. Man 
müsste große zusätzliche 
Disksysteme hinstellen, die 
Daten nachts überspielen und 
anschließend deduplizieren. 

Schiebt man die Daten 
hinterher weiter aufs Tape, 
muss man sie aus Gründen der 
Verfügbarkeit wieder duplizie- 
ren. Dadurch spare man letzt- 
lich nicht viel, meint der Back- 
up-Spezialist von ZAG, denn 
Deduplizierung sei nur wirk- 
sam, wenn alle Daten auf 
Festplatten liegen, was im 
Petabyte-Bereich an die Gren- 
zen der verfügbaren Kapazität 
stoße. Dagegen setze man die 
Deduplizierungstechnik an 
kleinen Standorten ein, weil 
man so den Datenbestand 
reduzieren könne, bevor man 
ihn über eine vergleichsweise 
langsame WAN-Verbindung 
repliziert. 


Hilfreiche 
Schnappschüsse 


Manche Anbieter propagieren 
Snapshots als Alternative zur 

Datensicherung. Sie haben je- 
doch mit Backup nichts zu tun 
- das ist zumindest die Über- 
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zeugung der Backup-Abtei- 
lung. Natürlich nutze man 
auch Snapshots. Ihr Vorteil be- 
stehe vor allem darin, dass 
man Restores über eine 
Schnittstelle von Windows di- 
rekt an die Fachabteilungen 
zurückgeben könne: Ältere 
Versionen lassen sich ohne 
Umwege reaktivieren. Außer- 
dem nutzt ZAG die Funktion 
„Snapshop Mirroring“ der 
Netapp-Filer, um Daten von 
einem entfernten Standort zu 
einem anderen zu übertragen. 

Im zentralen Rechenzen- 
trum kommen zurzeit noch 
keine Snapshots zum Einsatz. 
Man eruiere gerade, ob man 
sie verwenden kann, um die 
Systeme beim Backup zu ent- 
lasten oder bei logischen Aus- 
fällen ein System schnell 
wiederherzustellen. Eine wei- 
tere Einsatzmöglichkeit wäre, 
SAP-Systeme zu klonen. Eine 
Systemherstellung ließe sich 
über einen solchen Spiegel in 
ein bis zwei Stunden bewerk- 
stelligen, während sie momen- 
tan noch mindestens einen 
Tag in Anspruch nimmt. 

Ziel ist es, Snapshots als 
Grundlage für die Datensiche- 
rung zu nutzen, um das gesi- 
cherte Primärsystem nicht zu 
belasten: Das eigentliche Back- 


Networking - Hosting-Provider 


Die Branche der Webhoster ist 
erwachsen geworden. Ihre 
modernen Rechenzentren 
übernehmen mehr und mehr 
IT-Aufgaben im Auftrag von 
Unternehmenskunden und set- 
zen selbst die Maßstäbe in Sa- 
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chen Ausfallsicherheit, Ener- 
gie- und Kosteneffizienz. 
Damit ist Hosting heute ein 
Dienst, der für Großunterneh- 
men genauso infrage kommt 
wie für den Mittelstand und 
Privatanwender. Es gilt aller- 


Industrie-PCs und ihre Betriebssysteme 
Identitätsmanagement in heterogenen Netzen 
Speichertrend: SAN in a box 


up soll in Zukunft von einem 
Snapshot auf einem Sekundär- 
system gezogen werden. 


Vom Backup 
zum Archiv 


Bei der Backup-Abteilung von 
ZAG stellt man in Abrede, dass 
es genaue Definitionen für 
Backup und Archivierung gibt. 
Man habe in der Vergangen- 
heit für sich selbst strenge Re- 
geln erlassen und auf deren 
Grundlage bestimmt, was 
Backup ist. Auf der Basis von 
TSM hat man Aufbewahrungs- 
fristen von einem halben bis 
zu einem Jahr für Backups 
festgelegt, je nach Anforderun- 
gen der Applikationen. Eine 
automatische Übernahme in 
ein Archiv ist strikt untersagt. 
Ein Projektleiter muss gegebe- 
nenfalls das Archivieren be- 
stimmter Datensätze explizit 
anordnen. 

Dafür gibt es zwei Möglich- 
keiten: ein zertifiziertes revi- 
sionssicheres Archivsystem, 
in dem die Daten unverändert 
bis zu einem festgelegten 
Datum liegen, sowie als kos- 
tengünstigere Alternative einen 
sogenannten Langzeitdaten- 
speicher, der zwar ebenfalls 
die Integrität der Daten ge- 


dings, in einem Dschungel 
von Markennamen und Tarif- 
systemen den Überblick zu 
behalten. 
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währleistet, aber nicht zertifi- 
ziert ist. Letzterer speichert die 
Daten üblicherweise auf Tape, 
während bei Ersterem unter- 
nehmenskritische Daten auf 
Platte liegen. Außerdem spie- 
gelt ZAG sie auf ein weiteres, 
200 Kilometer entfernt stehen- 
des System, um die Verfügbar- 
keit zu gewährleisten. 

Löschoperationen sind in 
diesem Archivkonzept die Aus- 
nahme. Sie werden nur auf 
ausdrückliche Anordnung der 
„Herrn der Daten“ durchge- 
führt, der Projektverantwort- 
lichen und Leiter der Fachab- 
teilungen. Die IT-Abteilung als 
Dienstleister hat keine „Besitz- 
rechte“ an den Daten. Auch 
über deren (Un-)Wichtigkeit 
entscheiden nicht die IT-Leute. 
Es wäre kontraproduktiv, wenn 
die IT-Abteilung etwa „generell 
unwichtige“ MP3-Dateien 
automatisch auf günstigere 
Medien migrieren oder archi- 
vieren würde — es gibt auch 
Audiodaten, die man revisions- 
sicher aufbewahren muss. Aus 
dem Dateityp beziehungsweise 
der Namensendung lässt sich 
nicht ableiten, was man aufbe- 
wahren muss und was nicht. 
Das kann allein der Eigentü- 
mer, indem er die Daten be- 
stimmten Klassen zuordnet. 

Generell ist ZAG mit der ge- 
wählten Lösung zufrieden, 
zumal sie die Anbindung vieler 
Betriebssysteme und Anwen- 
dungen erlaubt. Allerdings 
wünscht man sich vom Soft- 
warehersteller IBM eine größe- 
re Wertschätzung für das 
Thema Backup. An die Daten- 
sicherung werde immer zuletzt 
gedacht - eine Haltung, die 
leider bei den meisten Herstel- 
lern zu beobachten sei. Die 
Entwicklung sei in der Regel 
zu sehr applikationsgetrieben, 
das Backup komme zu kurz. 
Außerdem vermisst der IT-Lei- 
ter eine Kooperation zwischen 
Anwendungs- und Speicher- 
anbietern. Zu oft müsse man 
als Anwender Druck auf die 
Hersteller ausüben. 
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